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Chapter 1 
Introduzione 


Non solo una questione da prima pagina: La cost detta “Big Data 
Revolution 1 ' e ora sullc bocche di tutti: come avremmo potuto tirarci fuori dal 
coro? Certa in ente la scelta dell’argomento e dovuta alia sua attuale rilevanza 
mediatica. Eppure per noi non e solo attualita, ma anche un’importante 
occasione per analizzare come sta evolvendo il metodo di ricerca scientifica 
e come si stanno trasformando i rapporti sociali, a partire dal lavoro, in 
relazione alio sviluppo delle nuove tecnologie. Come Officina questo e sempre 
lino dei nostri obbiettivi: farsi un’idea critica sulle relazioni che intercorrono 
fra scienza e societa. In linea con tale spirito, speriamo che il lettore possa 
trovare in questo documento qualche spunto originate per guardare in modo 
diverso la realta della scienza che lo circonda, ci teniamo a chiarire che la 
nostra trattazione degli argomenti non ha la pretesa di essere esaustiva, essa 
si presenta piuttosto come la condivisione in forma scritta di un percorso 
assemblcare di autoformazione e riflessione. 

Cosa sono? Come spesso accade e utile in principio aver chiara la dehnizione 
Per big data intendiamo tntte quelle collezioni di dati destrutturati le cui di¬ 
mension! superano le capaeita di memorizzazione, gestione e analisi tipiche 
dei tradizionali sistemi per basi di dati. Generalmente le loro caratteristiche 
vengono riassunte dalle cinque “v”: Volume, Velocita, Varieta, Viralita e 
Variabilita. Il volume e chiaramente riconducibile al peso in byte di questi 
ammassi di dati rnentre la velocita e riferita alia generazione e all’accesso di 
essi. Varieta e variabilita consistono nel fatto che, avendo forme differenti 
in origine, non possono essere ordinati in una struttnra prefissata. Inhne 
la viralita esprime il loro potenziale di impatto sociale dovuto alia veloce 
diffusione delle informazioni che vi si estraggono. 

Lin Data Scientist non ci metterebbe pin di un minuto a convincervi che 
e proprio su questa tecnologia che si basa il progresso ai giorni nostri: e su 
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questo che si deve investire, dato che in molti e grandi lo stanno facendo, e 
su questo che ci si deve specializzare, dato che sempre di pin sono e saranno, 
secondo il trend attuale, gli esperti del settore richiesti. Trend che e positivo 
e in stabile crescita. Dal 2016 al 2020 e previsto che si passi da 1,1 a 2,3 ZB 
di traffico IP (1 ZB = 1012 GB). Qualcuno li ha dehniti “il nuovo petrolio” 
e cercheremo nclle prossime pagine di capirne il motivo. 


Chi li produce? Noi tutti li produciamo. Quando ognuno di noi compie 
un’azione interfacciandosi con un dispositivo connesso alia rete, nulla va cli- 
menticato: immediatamente viene generate un hie in cui vengono salvati non 
solo i contenuti testuali o multimediali prodotti clalla nostra azione, ma an- 
che tutte lc informazioni ad essi connesse che prendono il norne di metadati. 
Percio quando apriamo Facebook, messaggiamo su Whatsapp, facciamo una 
ricerca su Google o vediamo un video su Youtube, i server dellc aziende ap- 
pena citate registrano l’indirizzo IP del computer utilizzato, l’ora, il luogo e 
tutto cio che fa da contesto alia nostra traccia digitale. 

Il grado di consapevolezza rispetto a cio da parte degli utenti risulta 
piuttosto variabile: da un parte siarno proprio noi ad accettare Termini e 
Condizioni di utilizzo dei servizi, dall’altra lo facciamo spesso senza sapere 
come i dati che generiamo vengono poi analizzati, e le deduzioni che ne 
vengono tratte. Dal momento che in questi server lo spazio di archiviazione 
dei dati e sufficientemente enorme, non c’e motivo per non conservarli. Quel 
che non strozza ingrassa e tutto, come vedremo, puo sempre tornare utile. 

Ma oltre a questi dati ci sono quelli prodotti da dispositivi non virtuali 
come le stazioni metereologiche, le webcam, i sensori del traffico, quelli di 
sicurezza, le immagini satellitari, i geo localizzatori, e tutti quegli oggetti, 
sempre piu diffusi, il cui utilizzo viene integrate da una connessione ad In¬ 
ternet (Internet of Things ??). Inhne ultimi, ma non per importanza, vi 
sono i dati tradizionali, raccolti dalle agenzie pubbliche, dagli ospedali, dalle 
banche e dai laboratori di ricerca. 


E poi... come vengono utilizzati? Una volta prodotti e acquisiti i 
dati sarebbe un peccato non utilizzarli per qualche scopo pratico che implichi 
possibilmcnte un margine di guadagno. Ma a seconda di quale scopo si cerchi 
di soddisfare varia il processo di claborazione, analisi, e interpretazione di 
questii. Ad esempio, sara capitato a molti di voi di vedere Google suggerirvi 
una chiave di ricerca diversa da quclla che avevate cligitato, il classico “forse 
cercavi: ....?” Come fa Google a sapere meglio di te qucllo che vuoi trovare? 
La risposta e che Google impara da tutte lc ricerche precedentemente fatte 
dai suoi utenti collczionando tutti i dati e metadati relativi a queste. Quindi 
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quella che viene valutata e la coerenza della vostra ricerca con la Storia dellc 
altre gia effettuate. 

Sicuramente, un’applicazione in cui Big Data giocano un ruolo fondamen- 
tale e quella della profilazione degli utenti e quindi di tutte le sue conseguenze. 
L’esempio pin semplice e quello della pubblicita mirata che possiamo esperire 
tutti i giorni considerando i banner che, ad esempio, dopo aver comprato un 
volo per Cuba, mostreranno durante giorni segnenti alternative di viaggio in 
offerta, guide economiche del Paese e bnsti di Fidel in plastica colorata. La 
profilazione tuttavia non si ferma ad un semplice resoconto dellc abitudini 
delhutente snlla rete ma puo consistere in un vero e proprio tracciamento del 
suo prohlo psicologico. Questa possibility apre la strada a nnove modalita 
di orientamento dell’opinione pubblica e di propaganda elettorale di cui si e 
avuto un esempio concreto durante lc nltimc presidenziali negli USA ??. 

Diverso e il caso in cui si voglia con i dati a disposizione fare una predi- 
zione su una situazione futura. In questo caso essi non devono solo consentire 
una ricostruzione del contesto da cui sono stati estratti, ma devono altresi 
permettere di prehgurarsi come si modihchera tale situazione dopo un certo 
tempo. Questa capacita predittiva puo avere differenti pretese che vanno dal 
semplice sondaggio, al controllo sociale sino all’effettiva necessita di fare pre- 
visioni su fenomeni fisici i cui modelli teorici non sono stati ancora sviluppati. 
Quest’ultima pretesa in particolare e al centro di un dibattito accademico 
molto accesso tutt’ora in corso ??. 

Abbiamo qui dato una panoramica generale sul tenia dei big data de- 
lineandone lc caratteristiche chiave e i principali utilizzi. Nei capitoli che 
seguono entreremo maggiormente in dettaglio su alcuni aspetti e questioni 
che sia da una prospettiva tecnico-scientihca che da un punto di vista sociale 
si collegano al fenomeno battezzato come “big data revolution”. 
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Chapter 2 
Lavoro 


Idea schema Capitolo 

2.1 Approccio micro 

Alla Curcio Bracciale che da compiti Gamificazione Atomizzazione Tay- 
lorismo digitale(lavorare tramite le app, quando il capo e un algoritmo) 


2.2 Meccanicizzazione del lavoro 

Dequalificazione del lavoro Come ci si reinventa lavorativamente Lavori creati 
da rivoluzione digitale: che lavori so? Da lavoro intellettuale a tecnico, in 
che rnodo? 


2.3 Strapotere della lobby dei dati 

Guarascio a mind the gap, i tre punti: estrazione, mercihcazione, sorveg- 
lianza. Perche monopolio si consolida. 

schema di Guarascio: DATI COME CAPITALE: il grande capitale di 
grandi Company (come Google) consiste nei dati da esse accumulati; 1) ven- 
gono monetizzati una volta che sono elaborati e venduti come previsioni o 
pubblicita mirate. 2) l’accumulazione iniziale di questo capitale, cio che ha 
dato a Google questo scarto irrecuperabile rispetto alle competitor, e da 
considerare paralegale perche un carnpo ancora non legiferato (non bene). 3) 
Dati che sono personali, intimi: quanto pin intimi tanto pin interessanti. 3.a) 
Mercicazione: della personalita che viene ridotta a insieme di dati. Ovvia- 
mente per I’impreditore non e interessante hindividuo in quanto tale. Peri- 
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coloso in quanto crea distacco dalla realta. 3.b) Sorveglianza: siamo tutti 
fonti di dati quindi tutti sotto osservazione e misura. non per forza pero dal 
Grande Fratello 



Chapter 3 
Scienza 


I Big Data rappresentano sicuramente una fonte di innovazione notevole 
nell’ambito della ricerca scientifica. Le nuove tecniche di accumulazione ed 
analisi dei dati sono divenute strumenti imprescindibili in moltissimi settori 
della scienza. Questo innegabile progresso ha portato una parte della comu- 
nita scientifica a sostenere che di fatto il fenomeno dei Big Data vada oltre il 
semplice avanzamento tecnico, ma implichi addirittura un nuovo paradigma 
scientifico, ovvero una nuova modalita di produzione dclle verita scientifiche. 
Crediamo sia opportune) addentrarc-i ncl dibattito accademico scaturito da 
quest a nuova posizione. Nei prossimi paragrafi proveremo quindi da un lato a 
descrivere brevemente le tecniche sopracitate insieme al loro utilizzo nel caso 
paradigmatico della biologia molecolare; dall’altro ad analizzare lo schema di 
argomentazioni degli ’’entusiasti” dei Big Data mettendone in evidenza al- 
cuni punti critici. Procediamo in questo modo convinti del fatto che l’analisi 
dettagliata di qualunque tipo di innovazione debba andare di pari passo con 
la capacita di vedere oltre le narrazioni autocelebrative che spesso la accom- 
pagnano. 


3.1 Machine Learning 

Quando vi sono dei modelli teoric-i questi schematizzano il problcma, ne in¬ 
dividuals le variabili rilevanti e le mettono in rclazione in modo tale che 
se ne possa dedurre il risultato al variare del tempo. Quando invece questi 
mancano e non e noto ne quali siano le caratteristiche dclhoggetto rilevanti 
da prendere in considerazione, ne quale relazione intercorra fra queste e la 
predizione viene fatta in altro modo. Negli ultirni anni vasto e rapiclo e stato 
lo sviluppo di metodi informatici come il Machine Learning. Sotto questo 
nome si raccolgono moltissimi algoritmi di analisi diversi, ma essenzialmente 
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le tecniche di processamento dei dati sono due: l’apprendimento supervi- 
sionato e quello non supervisionato. Di cosa si tratta? In cosa differiscono? 
Qncl piccolo awerbio negativo sta ad indicare una differenza sostanziale: nel 
primo caso abbiamo dei dati con certe caratteristiche che sono divisi in un 
certo numero di classi. La macchina impara da qnesti dati le regole per 
suddividere i prossimi input nellc diverse classi. Se consideriamo come es- 
empio individui con un profilo facebook possiamo raggrnpparli nellc classi di 
“timidi” e “estroversi” in base a un nostro personate metro di giudizio. Suc- 
cessivamente prendiamo in considerazione per ognuno il numero degli amici 
che ha associati al suo prohlo e facciamo si che la macchina impari come 
qnesta caratteristica si associa alia suddivisione in classi. In qnesto modo 
chi il giorno successivo crea un nuovo prohlo e manda un certo numero di 
richieste di amicizia e subito classihcato sulla base di queste in timido o il suo 
contrario. Si tratta di un esempio banalizzante: e evidente che non basta il 
numero degli amici su facebook per deknire quanto qualcuno e effettivamente 
propenso all’interazione sociale. Ma se oltre al numero di contatti si consid- 
erassero anche il numero di post pubblicati, quelli commentati, i like rnessi 
a determinate pagine e il numero e tipo di gruppi a cui si e iscritti la clas- 
sikcazione ottenuta sarebbe forse meno discutibile. Nella seconda tecnica, 
quclla dell’apprendimento non supervisionato, i dati non sono in partenza 
associati a classi, e quello che gli algoritmi devono riuscire a fare e dehnire 
dei gruppi di oggetti in base alle loro somiglianze. In altre parole si dice che 
devono svelare correlazioni intrinseche. sia quali siano le classi, sia come i 
dati sono associati a queste. Con queste tecniche si ottengono correlazioni 
fra i dati sufficienti a stimare, con un grado di accuratezza che dipende clalla 
quantita e qualita dei dati presi in esame. 


3.2 Nuovo paradigma scientifico 

Esiste una parte consistente della comunita scientihca che ritiene l’apporto 
dei big data capace di eliminare la necessita di produrre teorie. Questo 
paradigma e ben riassunto dall’affermazione solo in parte provocatoria ”bas- 
tano le correlazioni” contenuta nell’articolo di Andersen dello 2002 titolato 
”The end of theory”. [?]. Piu concretamente oggi istituti di ricerca come 1’ISI 
FOUNDATION stando lavorando precisamente in questa direzione. Cerchi- 
amo di spiegarci rneglio: per dehnizione la scienza cerca di studiare vari 
fenomeni andando a evidenziare di volta in volta le variabili rilevanti del prob- 
lerna e ipotizzando, tramite un modello, delle relazioni causali fra queste. A 
quel punto il metodo sperimentale permette, a partire dal confronto fra pre- 
visioni teoriche ed esperimenti, di verihcare la veridicita delle ipotesi. Quello 
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che oggi si sostiene in alcuni ambiti della ricerca scientifica, e la possibility 
che un algoritmo possa di fatto sostituire il sopracitato procedimento teorico, 
arrivando alia comprensione del problema in modo pin efficiente di quanto 
un essere uniano possa fare. Potrebbero sorgere alcune domande su due pi- 
ani diversi: happroccio Big Data ncl dare risposte e davvero cosi universale? 
Puo essere considerate un metodo generate e affidabilc nell’approcciare una 
grande varieta di problemi? In secondo luogo, ammesso che ci riesca, una 
volta risolto il problema in questo modo, che tipo di conoscenza si acquisisce? 
In che modo essa differisce da quella ottenuta con l’approccio modcllistico? 
Partiamo dalla seconda questione, che in realta rimanda al ben noto prob¬ 
lema della relazione fra scienza e tecnica. L’ubiqua confusione fra verita 
tecnica e verita scientifica e uno dei tratti distintivi del mondo contempo- 
raneo di intendere la ricerca. Dal nostro punto di vista e solo nel solco di 
questo fraintendimento epocale che e possibile affermare che la Big Data 
science sia indipendente dalla teoria. Quello che ci sentiamo di affermare e 
che la conoscenza basata sui big data sia di tipo prettamente tecnico capace 
di fornire a volte soluzioni pratiche, anche molto efficienti, senza pero dare 
spiegazioni esaustive e generalizzabili sulle dinamiche alia base dei fenomeni 
studiati. Per fornire un piccolo esempio, sicuramente un computer al quale 
diamo in pasto una grande quantita di dati sulle traiettorie dei pianeti sara in 
grado di riscoprire lc tre leggi di Keplero, ma non sara mai capace di fornire 
le leggi di Newton, ne tanto meno sara capace di dimostrare come tali prin- 
cipi primi implichino la fenomenologia osservata. Date queste considerazioni 
diventa semplice rispondere anche alia prima questione: il sapere tecnico e 
per sua stessa natura un sapere i mm ediate e particolare, difhcilmente gen- 
eralizzabile. (FORSE ROBA DA AGGIUNGERE) Non bisogna scordarsi in 
tutto cio che la scienza non persegue linearmente il hlo rosso dell’aumento 
della conoscenza ma e anche influenzata da mode passeggere, dettate dal sis- 
tema economico in cui si esprime, di cui i big data sono un esempio. Ma una 
moda puo cambiare, e lo fa ogni giorno, gli apparati, lc strutture, la materi- 
alita che sottende la scienza, diventando l’imposizione di un nuovo modello 
dominante, alle spese di tutti i hloni di ricerca non allineati. (slides salina) 


3.3 Big Data e biologia 

Sempre di piu e in modo crescente negli ultimi anni la biologia si serve di 
strumenti informatici per procedere nelle sue ricerche, tanto che ad oggi un 
biologo nella maggior parte dei casi ho ha queste competenze o lavora in 
equipe con chi ne ha. Eppure e proprio dal mondo biologico che ha preso 
ispirazione chi ha sviluppato gli algoritmi di intelligenza artihciale e dei neu- 
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ral network che ora non si puo prescindere dall’utilizzare! Dal duemila con 
il Progetto Genoma Umano ad oggi i dati di arnbito biologico e medico sono 
cresciuti esponenzialmente: analisi di sequenza di DNA, RNA, proteine, pro- 
cessi di regolazione, vie metaboliche.. Grazie ai vasti spazi di archiviazione e 
possibilc conservare genomi di miliardi di paia di basi di migliaia di organismi, 
gli algoritmi di analisi permettono di estrarne velocemente informazioni, lc 
tecniche di Machine Learning rendono possibilc stabilire a quale malattia si 
e predisposti partendo da singoli polimorfismi del proprio DNA.. La ricerca 
biologica e quella meclica paiono far veloci passi avanti grazie alio sviluppo 
dei Big data e dcllc tecnologie ad essi associate, nra come 



Chapter 4 

Profilazione e controllo sociale 


Nclla societa’ dell’informazione tutti gli ambiti della vita, pubblica e pri- 
vata sono investiti dal carnbio di paradigma dovuto all’utilizzo dei Big Data. 
Dopo aver discusso di quali sono gli effetti di questa tecnologia nel mondo 
delle scienze o del lavoro, vogliamo adesso concentrarci sull’inipatto di questo 
nuovo strumento sulla sociality, sui rapporti interpersonali e sulla politica. 
La nostra analisi non puo che essere parziale, perche ciascnno vive la propria 
individuality in modo diverso, e quale sia la pervasivita di questo fenomeno 
dipende dal singolo. Eppure sulla strada del collcttivo Ippolita, che magistral- 
mente racconta nei suoi libri gli effetti dei Social Network sull’emotivita degli 
utenti, cercheremo di guardare a dei punti cardine e di entrare nel dettaglio 
di alcuni aspetti e seguiremo i ragionamenti di altri autori per trattegiare al- 
cuni profili di un problema dagli infiniti aspetti. Partiremo dal piccolo, clalla 
quotidianita delle persone per vedere in che modo gli oggetti Smart incidono 
sullc abitudini e sulhimmaginario degli utilizzatori, a seguire ci allargheremo 
a le interazioni che si hanno quando si vogliono avere informazioni dal mondo 
esterno, parleremo di Filter Bubble e di come la profilazione incide sulla po¬ 
litica e sullc campagne elettorale, inhne tratteremo di Embers, un software di 
previsione delle agitazioni sociali. Nclla nostra discussione osserveremo come 
il potere, che sia esso economico, politico, ma sopratutto tecnico, utilizza 
questa tecnologia e quale sono le ricadute sul benessere e sulla consapevolezza 
dei cittadini e delle cittadine. Quando parliamo di potere tecnico ci rifcriamo 
a colui che ha la possibility di ricostruire porzioni di realta attraverso il pro- 
cessamento dei dati; infatti i dati che produciamo quotidianamente sono usati 
per ricostruire i nostri spostamenti, le evoluzioni emotive, il nostro pensiero 
su un determinate argomento, alio stesso modo possono riguardare la collet- 
tivita, dove ad essere oggetto dell’inferenza, della ricostruzione, non pin gli 
individui, ma interi gruppi o comunita. L’identihcazione di comportamenti, 
o piu esattamente di pattern, e il cavallo di battaglia dei moderni algoritmi 
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e della computer science e la possibility di sfruttare queste conoscenze e una 
prerogativa di chi ha abbastanza soldi da sovvenzionare un centro di ricerca 
informatico, con i costi che una vasta rete di macchinc e di lavoratori com- 
porta. 
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13 


4.1 L’loT e’ la panacea dei casalinghi tecnofili 

IoT e’ una delle tante sigle che popolano il mondo dell’informatica, la si trova 
sui siti ’geek’ o nellc rubriche delle riviste, e sta per Internet of Things. 

L’idea dell’Internet of Things viene introdotta da Aston ncl 1999,l’articolo 
originate e’ disponibilc a [?], e prospetta la possibility di salvare tempo utile 
delle persone, lasciando ai computer il duro compito di esplorare da loro 
la realta, senza attendere che sia un umano a fornire i dati da claborare. 
Ncll’arco degli anni, 1’IoT, si e concentrato sulla domotica, e si riassume 
1’idea dicendo: ”L’IoT e il tuo frigo che parla con la lavatrice”, e riprendendo 
lo spunto dcll’articolo di Aston offrire la possibility di relazionarsi con gli 
oggetti attraverso il linguaggio naturale, come nei film di fantascienza. La 
domotica tuttavia e una scienza ben piu antica e i suoi fini sono piu concreti, 
Lottimizzazione dei consumi e dei tempi in casa, giusto per capire il punto 
di partenza, quando si tratta di domotica si parla di sensori termici e orologi 
sparsi per casa che accendono i riscaldamenti o fanno partire la macchina del 
caffe all’ora della sveglia; queste tecnologie sono nate nel mondo analogico 
e spesso non necessitano un controllo rernoto, piuttosto permettono di pro- 
grammare e attuare delle routine domestiche in modo automatico. L’loT si 
presenta come una radicale rivoluzione di questo mondo delle cose: ora, oltre 
ad essere programmabili e ’sensibili’, gli oggetti divengono parlanti! 

Basta aggiungere una connessione wifi al frigo, alia lavatrice o al folletto, 
ed ecco che e possibile comandarli da rernoto o addirittura attraverso i so¬ 
cial network. Questa ’rivoluzione’ informatica e informatizzante si traduce 
in una sterminata rete di sensori che mappano la realta e la traducono in 
un’immagine digitate, quando ci si riferisci a questi rinnovati oggetti si usa 
l’appellativo di Smart. Cerchiamo atlora alcuni esempi per capire rneglio 
quali oggetti e arnbiti della vita possono essere investiti da questa ventata di 
innovazione digitate. 

Facciamolo cercando di immaginare la vita di Mario, un cittadino tec- 
nofilo, e abbastanza ricco da permettersi dei simpatici gadget: Si comincia 
con Bonjour L , la sveglia intelligente che rnette insieme informazioni su traf- 
fico, rneteo e agenda per salvaguardare il pin possibile il tuo sonno, a Bonjour 
dovrai fornire informazioni sulla tua quotidianita e elencare metodicamente 
i tuoi appuntamenti. Probabilmente la sveglia puo twittare alia machinetta 
del caffe e dirgli di accendersi; quindi si esce e si safe sulla futuristisca Smart- 
Car che impostasta la destinazione ci conduce ncl piu breve tempo possibile 
conoscendo il traffico e lc abitudini degli altri utenti. Ovviamente Mario in- 


^^http: / / www.smartworld.it/tecnologia/bonjour-sveglia-snrart.html// 
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dossa fitbit 2 ]] che monitora i parametri vitali e controlla che tutto sia nella 
norma, mandandoci un messagino quando siarno arrabiati, tenendo d’occhio 
la qualita del nostro sonno e assicurandoci un rapporto digitate con il nos¬ 
tro corpo. Fin qui sembra che sia tutto ok, che Mario abbia degli effettivi 
vantaggi in termini di efficienza e tempo risparmiato, ma non abbiamo con- 
siderato la possibility che nella sua borsa ci sia Hidrateme, 3 la borraccia 
intclligente che ci ricorda di bere se abbiamo sete inviandoci una notifica, o 
che in casa disponga di qualche altra diavoleria come SMALT, il dispensatore 
di sale che controlla la quantita di minerale assunta. Molte di queste trovate 
sono elencate in https://weputachipinit.tumblr.com/. 

Insomnia parafrasando la simpatica storiella di Mario qucllo che ci preme 
dire e che se da un lato alcune innovazioni ci fanno risparmiare tempo perso 
e forse migliorano la qualita dclle nostre giornate, dall’altro ci deresponsabi- 
lizzano e ci abituano a delegare Lattenzione e in alcuni casi la volonta a degli 
oggetti. E’ solo una questione di principio la nostra scherzosa critica all’IoT? 
Perche se cosi fosse dovrebbe esser riservata ai singoli c lasciare a ciascuno la 
scelta di quanta attenzione porre nella proprie azioni quotidiane. Tuttavia 
ci sentiamo di sottolineare che l’alienazione di cui questa tecnologia e foriera 
e estremamente pervasiva e ci immerge in una spirale di dipendenza dagli 
oggetti che nella loro onnipresenza condizionano le nostre scelte e lc nostre 
attivita. 

Tutto questo per non parlare dei possibili, e probabili, disagi che una vita 
iperinformatizzata nasconde. Uno dei piu recenti casi e l’aggiornamento del 
hrmware di Ilocks 4 , che controllava la serratura di molte abitazioni e per un 
malfunzionamento ha lasciato fuori centinaia di utenti. 

D’altro canto e’ importante parlare di IoT perche l’atrofizzazione della 
scelta e solo la punta di un grande iceberg. La questione che ci preme dis- 
cutere in questo paragrafo e che molti dei dati prodotti dai sensori dell’IoT 
hniscono, in un modo o nell’altro, in Internet. I modi in cui questi dati 
possono essere ottenuti sono molteplici, in alcuni casi sono le stesse aziende 
produttrici che li raccolgono, che questa clausola sia inserita nei Termini 
d’Uso o sia caldamente suggerita dal software al primo avvio conta poco; al- 
tre volte sono gli stessi utenti che li condividono perche spinti dall’edonismo 
della rete che vuole conoscere i risultati e mettere in competizione hnanche gli 
sportivi della domenica. I dati ottenuti attraverso lc SmartTv, i frigoriferi a 
scansione o i termostati fanno gola a molti, che siano essi soggetti economici 

2 https://www. fitbit. com/it/home[[ 

3 https : / /www.kickstarter.com/projects/ 582920317 /hidrateme — smart — water — 
bottlelref = category r ecommended 

4 https://www.theregister.co.uk/2017/08/ll/lockstate_bricks_smart_locks_ 
with_dumb_firmware_irpgrade/ 
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che pagano per ottenere profilare gli utenti e creare pubblicita o prodotti 
piu appetibili, o che siano agenti piu subdoli che si propongono di aggregare 
queste informazioni ottenute ai margini della lcgalita e una volta arricchite 
rivenderle a terze parti. I casi di leak ovvero di fuga di informazioni. infmem 
sono numerevoli, ci limitiamo a citarne uno che ha scosso l’opinione pubblica 

5 


5 https://motherboard.vice.com/en_us/article/pgwean/ 
internet-of-things-teddy-bear-leaked-2-million-parent-and-kids-message-recordings 
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4.2 Embers 

Nel 1951 Isaac Asimov pubblica una serie cli racconti cli fantascienza, poi 
raccolti nella Trilogia della Fondazione, la storia ruota attorno al crollo 
dell’Imper Galattico e della cricca di scienziati che la prevedono con l’ausilio 
della Psicostoriografia. Se l’autore e famoso per le Tre leggi della robotica, il 
suo contributo nella sociologia e meno palese ma altrettanto importante: la 
psicostoriografia si dclinea come la scienza dclle masse, un misto tra econo- 
mia e sociologia, che attraverso il processamento dellc informazioni disponibili 
alia ’regia accademia’ dell’Impero riesce a prevedere e prevenire il fragoroso 
crollo politico della galassia. Sorvoleremo sull’autentico positivismo di Asi¬ 
mov e sullc implicazioni politiche del libro, ma vorremo riprendere qnesta 
neonata scienza per capire quali sono le sue possibility e se nei 70 anni che ci 
separano dalla pubblicazione del testo la tecnologia si e evoluta abbastanza 
da considerare realta il sogno dcllo scrittore statunitense. Il problcma della 
psicostoriografia e la previsione degli sconvolgimcnti sociali, e la capacita di 
leggere tra le righe della storia e anticipare il futuro, compito degli psicos- 
toriografi e maneggiare questa conoscenza e stimolare la massa nel modo 
efficace a realizzare il futuro voluto. Questa scienza ha il lirnite della massa, 
non da risultati se il campione e troppo ristretto, e alio stesso modo non 
puo anticipare le scelte degli individui, ne tantomeno prevedere le strategic 
dei leader politici, tuttavia risulta esatta e ’computabile’ se il soggetto in 
analisi e la vasta popolazione dell’Impero Galattico. La psicostoria e, cosi 
presentata, la scienza che ciascun governante vorrebbe dalla sua, essa per- 
mette di prevedere e prevenire le dissidenze e armonizzare i conflitti interni 
con opportune politiche. 

Ma questa scienza non e certo figlia del futuro, anzi sappiamo come la 
suggestione delle masse e una pratica consueta nei governi occidental^ un 
esempio a noi vicino e la recente guerra in Iraq, che ha guadagnato il consenso 
della popolazione americana attraverso la diffusione ad arte di informazioni 
false sulle armi di distruzione di massa nelle mani di Saddam. O ancora, come 
lo stragismo nero dell’Italia ’70 ha stimolato la popolazione a votare per la 
sicurezza e la stabilita proposta dalle forze moderate e ha impedito l’ascesa 
della sinistra radicale. Insomnia, non serve prevedere matematicamente i 
risultati per stimolare la massa a comportarsi come voluto, piuttosto servono 
le risorse di cui uno Stato dispone, serve un controllo efferato sugli organi 
di stampa e la feroce volonta politica di impedire l’evoluzione del processo 
democratico. Che c’entra tutto questo con Mind The Gap? Semplice, la 
psicostoria e i Big Data sono intimamente legati! Infatti se le capacita degli 
analisti superano per accuratezza e complessita quelle della macchina, la 
raccolta dei dati e la loro digestione e stata fino ad ora il compito pin arduo, 
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e noioso!, che i Servizi e le varie agenzie si trovavano a dover compiere. Ma 
da qualche anno il governo americano si e proposto di rinnovare e migliorare 
questo processo: alia vasta serie di software di previsione che l’avvento del 
Machine Learning e della statistica inferenziale ha reso possibilc la Descovery 
Analitics Centre della Virginia Polytechic Institute ha aggiunto EMBERS, 
un progetto che dal 2012 predice ogni giorno 40-50 eventi di rilevanza sociale 
in molti paesi del Sud America. [1] I hnanziamenti arrivano (22 milioni) 
dall’agenzia di intelligence di stato americana (IARPA) 6 in quanto parte del 
progetto OSI (Open Source Indicators, 7 ), con una collaborazione attiva in 
termini di ricercatori e hnanziamenti di molte universita americane. 

Lavora utilizzando dati come tweets, pagine facebook , blog posts, ricerche 
di Google, Wikipedia, dati metereologic-i, indicatori hnanziari ed economic-i, 
immagini satellitari. I dati utilizzati sono OpenSource, ovvero accessibili 
attraverso internet da qualsivoglia operatore, questi dati, che sono di fatto 
BigData, sono dehniti dagli autori del progetto come massivi, passivi In- 
stancabile il programma lavora 24h, 7su7, offrendo pronostici sugli eventi 
che sconvolgeranno i paesi posti sotto osservazione. I tipi di eventi prevedi- 
bili sono epidemic di malattie rare o di inhuenze, rivolte ed elezioni poilitche; 
ma gli autori del progetto sono, inaspettatamente, interessati alle ultime due 
classi di eventi. Nell’articolo gia citato, con cui Embers si presenta al mondo, 
i ricercatori elencano i successi ottenuti nclla previsione di eventi quali la pri- 
mavera brasiliana del 2013, le violente proteste degli studenti venezuelani del 
2014, le elezioni presidenziali di Panama e Colombia sempre del 2014. 

EMBERS si presenta come il hore all’occhiello della ricerca in casa Iarpa, 
infatti rispetto ai presistenti progetti (ICEWS, PITF), il sistema ha un’accuratezza 
clevata, hno ad indicare citta, giorno e volume dell’assembramento di per- 
sone. Inoltre, I’utilizzo di motori per l’analisi e la produzione di testo natu- 
rale consente un certo livcllo di comprensione del fenomeno in questione, e 
fmanche una narrazione dell’evento: Per capire come un marchingegno del 
genere possa funzionare entriamo nel dettaglio del sistema: Il processo di 
analisi di embers comprende quattro stadi: 

• Ingestion: aquisizione dei dati OS dalle varie fonti elencate, per far cio 
serve un sacco di spazio e delle connessioni molte veloci. 

• Enrichment: qui i dati vengono ’migliorati’, il testo viene processato e 
si tenta di iferire la citta e altre informazioni sulhautore del post o del 
tweet. 


‘’https : //www. iarpa. gov/ 

'https://www.iarpa.gov/index.php/research-programs/osi 
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EMBERS forecasts that there will be a violent protest on February, 18th 2014 in Cara¬ 
cas, the capital city of Venezuela. We predict that the protest will involve people working 
in the business sector. The protest will be related to discontent about economic policies. 
There were 5, 5, and 5 other similar warnings in last 2, 7 and 30 days, respectively. 

The forecast date of the warning falls in week 7, which may have historical importance; 
this week is found to be statistically significant (pval=0.00461919415894, zscore=2.832, 
avg. count=57.25, mean=21.569 +/- 12.597) 

Audit trail of the warning includes an article printed 2014-02-17. 

Major players involved in the protest include Venezuelan opposition leader, students, 
President Nicolas Maduro, and Leopoldo Lopez. 

Reasons : Protest against rising inflation and crime; Protestors want a political change; 
President Nicolas Maduro has accused US consular officials and right-wing. 

Protests are characterized by : Venezuelan opposition leader spearheaded days of protest 
and calling for peaceful demonstration; Maduro accused official on 2014-12-16; Protests 
have seen several deadly street : Three people were killed on 2014-02-12; Demon- 

st rat i< ms setting days of clashes; supporters to march t > Interior Ministry < >n 2014-02-18. 


Figure 4.1: An example narrative for a EMBERS alert message. Here, color 
red indicates named entities, green refers to descriptive protest related key¬ 
words. Items in blue are historical or real time statistics and those in magenta 
refer to inferred reasons of protest. 


• Modeling A questo punto viene compiuta l’analisi secondo i modelli che 
costituisconoil core di EMBERS. Qua awiene il miracolo big data: i 
dati vengono rnessi i relazione e si esplorano la semantica e il volume 
dcllc manifestazioni programmate. Gli algoritmi messi in campo sono 
i seguenti: 

- Planned Protest Model; dai social sono identificati specifici segni di 
chiamate a eventi di protesta (con luogo e data); 

- Dynamic Query expansion; usa twitter per identihcare tempo e luogo 
di diffusione nell’uso di alcune parole chiavi legate alle proteste; 

- Volume-based model si serve di molti dati di indicatori sociali, eco- 
nomici, politici. 

- Cascade regression model modellizza le attivita su Twitter che siano 
legate con organizzazioni e mobilitazioni; 

- Baseline model usa un modello di stima a partire dallo storico degli 
eventi del GSR (a monthly catalog of events as reported in newspapers 
of record in 10 Latin American countries). 

• Selection Integrazione dei risultati e presentazione dellc predizioni fi- 
nali, come in Fig. 4.1 

Preferiamo non entrare nel rnerito dei risultati, di capire quali sono le par- 
ticolarita del processamento dei dati, perche questi sono dettagli del progetto 
e nel corso degli anni miglioreranno. Piuttosto potremmo cercare di capire 
quali sono gli obiettivi di tale progetto, e con quale spirito questa ricerca viene 
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messa in atto. Gli stessi autori si prendono la briga di discutere gli effetti 
di questo strumento ncllo scenario politico internazionale, affermando che si 
tratta di nno strumento pericoloso se nellc mani di un governo autoritario. 
Ma perche preoccuparsi se gli autori fanno parte del piu grande exporter di 
democrazia al mondo? Se EMBERS e utilizzato da un governo attento e pre- 
muroso come qucllo statunitense, esso e da considerare un sensore accurato 
degli umori dei cittadini rispetto allc politiche governative, uno strumento ca- 
pace di far sentire piu forte la voce di tutti, di avvicinare i cittadini ai palazzi 
del potere. Questo passaggio non e affatto scontato, riuscire a cogliere le ra- 
gioni del malcontento non vuol dire essere interessati a soddisfarle. Piuttosto, 
se osserviamo questo scenario con gli occhi del XXI secolo, ci accorgiamo che 
questo strumento e incline a degradare la protesta politica come una ques- 
tione di ordine sociale, divenendo uno strumento poliziesco piu che politico. 
Come strumento poliziesco e senza dubbio estramamente efficace; le infor- 
mazioni ricavate aiutano ad individuare quali sono i temi che muovono nellc 
strade quali strati della popolazione e questa conoscenza diviene preziosa per 
i ministeri degli Interni che in tutto il mondo agiscono la politica del dividi et 
impera. Altro scenario pessimistico, difficile fare altrimenti quando si parla 
di questi strumenti, si viene a delineare allargando lo sguardo al complesso 
dei sistemi che EMBERS utilizza per estrarre informazioni. Non possiamo 
considerare il governo statunitense estraneo agli interessi di queste compag- 
nic private: Google News, Faeebook, Twitter, etc... anzi dobbiamo tenene 
conto dclle sempre piu attiva partecipazione di queste entita alia discussione 
politica internazionale, in particolare nclla loro attivita di censori, e della 
loro connivenza col potere, votata al mantenimento dclhordine e della pace 
sociale. Inline, se questo strumento resta nelle mani di un ristretto manipolo 
di stati, e evidente lo sbilanciamento che si viene a creare nella politica in¬ 
ternazionale! Non a caso EMBERS e stato sperimentato sui paesi del Sud 
America su cui la politica imperialista statunitense ha una lunga tradizione. 

A conclusione di questo paragrafo sottolineamo che la tecnologia pub 
rivelarsi uno strumento antidemocratico, e che la prohlazione dellc masse, 
oggi possibilc ncl paradigma big data, piuttosto che favorire l’emancipazione e 
la risoluzione dei bisogni dei molti pub favorire l’azione dellc forze poliziesche 
e la repressione dellc istanze di conffitto. 
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PARTE DISCORSIVA: -Cosa sono -Chi li produce -Utilizzo 

CAPITOLI: -l)Lavoro -2)Scienza -3)Profilazione e Controllo sociale - 
4)Non neutrality della scienza: modelli di interpretazione della realta e im- 
plicazioni sociali delle nuove tecnologie. Le singole innovazioni non possono 
essere comprese se decontestualizzate dalle loro ripercussioni sociali, la scelta 
di un particolare modello scientifico non e neutrale ncl senso che ’’perturba” 
in rnodo altrettanto particolare il mondo ovvero il suo oggetto di studio. 

Argomenti da inserire nei capitoli: 

Embers-^3) Biologia-^2) Criminologia-^3) IoT-^3) Filter Bubble-,M) Curcio/Guarascio/Pic 
ll) Numerificazione realta anche in relazione al rnerito e alia valutazione- 
£l),4) Big Data come nuovo paradigma-^,2) Assnnzioni automatizzate-^l),3) 

Cambridge analytica -}, 3) Machine Learning-/,2) 
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